SPSS MEANS - 按类别统计

作者: Ruben Geert van den Berg 发表于 SPSS 表格 & SPSS A-Z

SPSS 的 MEANS 命令可以生成包含不同组案例的均值和/或其他统计量的表格。这些组由一个或多个分类变量定义。如果满足假设,MEANS 命令之后可以进行 ANOVA(方差分析)。本教程将介绍它的主要选项,并指出一些技巧。您可以下载并打开 freelancers.sav 文件来跟着操作。

SPSS Data View Freelancers

SPSS 快速数据检查

由于我们将对 income_2010 运行一些表格,我们首先使用 FREQUENCIES 命令 快速查看它的直方图。请注意,下面的 语法 (syntax) 中的第二行抑制了频率表。我们还使用 FORMATS 命令 隐藏了 income_2010 的所有小数位,以抑制输出表格中过多的小数位。

***1. 快速检查。**
FREQUENCIES income_2010
/FORMAT NOTABLE
/HISTOGRAM.

***2. 稍微抑制过多的小数位。**
FORMATS income_2010(DOLLAR8).

SPSS FREQUENCIES Histogram

SPSS MEANS - 最小化使用

由于我们的直方图没有显示任何异常情况,我们现在可以运行 MEANS 命令。最简单的方法是运行 MEANS income_2010.

SPSS MEANS Output 1

结果与单个变量的 DESCRIPTIVES 命令基本相同,但当指定多个变量时,MEANS 命令将使用不同的表格结构,我们稍后将看到这一点。

这里我们不喜欢的一件事是标题(“Report”)。但是,通过使用 SPSS 表格模板(.stt 文件),我们可以使其不可见并放大行变量(“Gross total …”)的 变量标签 (variable label),使其看起来像标题。我们将在本教程的其余部分这样做。

SPSS MEANS Output 1b

SPSS MEANS - 典型用法

第一个 MEANS 示例生成了所有案例的平均收入。但是,我们通常使用 MEANS 命令来生成不同组案例的均值。例如,下面的语法分别生成不同行业的平均收入。

***按行业划分的 2010 年收入均值。**
MEANS income_2010 BY sector_2010.

SPSS MEANS Output 2

SPSS MEANS - CELLS 子命令

下面的语法的第二行包含一个 CELLS 子命令。它指定了哪些统计量(列)以什么顺序包含在内。
请注意,MEANS 命令在这里比 DESCRIPTIVES 命令有更多的选项,所有这些选项都可以通过在 CELLS 子命令上指定 ALL 来包含。

***使用 CELLS 子命令选择列及其顺序。**
MEANS income_2010 BY sector_2010
/CELLS COUNT MIN MAX MEAN STDDEV.

SPSS MEANS Output 3

SPSS MEANS - 多因素表格 (Multiway Tables)

通过使用多个 BY 子句生成多因素表格。例如,下面的语法分别生成每个性别和行业组合的平均收入。你可以使用两个以上的行变量,但在这种情况下,生成的表格会相当混乱。

***三因素表格:2010 年的收入按性别和行业划分。**
MEANS income_2010 BY gender BY sector_2010
/CELLS COUNT MIN MAX MEAN STDDEV.

SPSS MEANS Output 4

SPSS MEANS - 在一个表格中包含多个度量变量 (Multiple Metric Variables)

可以在 BY 关键字之前指定多个度量变量(可能使用 TO 关键字),如下面的语法所示。如果您重现此表,请注意某些结果是完全错误的,因为我们未能为 income_2012 指定 用户缺失值 (user missing values)。这导致一个 MEANS 表格,其中度量变量作为列。在这种情况下,统计量和一个或多个行变量定义了行,如以下屏幕截图所示。如果您不喜欢这种结构,您可能更喜欢对单独的表格使用单独的 MEANS 命令。

***在具有不同表格结构的单个表格中包含多个度量变量。**
MEANS income_2010 TO income_2014 BY sector_2010
/CELLS COUNT MIN MAX MEAN STDDEV.

SPSS MEANS Output 5

SPSS MEANS - 多个表格

BY 关键字之后指定多个变量会导致多个表格,这些表格具有相同的列,但行变量(分类变量)不同。下面的语法给出了一个例子。

***多个表格,具有不同的(分类)行变量。**
MEANS income_2010 BY sector_2010 TO sector_2014
/CELLS COUNT MIN MAX MEAN STDDEV.

SPSS MEANS - 最后的提示

我们对 MEANS 命令的讨论绝不是详尽无遗的;您可以查阅命令语法参考以获取更多选项。我们故意跳过了 STATISTICS 子命令,因为它没有提供任何用于评估统计显着性检验的基本假设的选项。